FILE(1) | Manuel de l'utilisateur Linux | FILE(1) |
NOM¶
file - Déterminer le type d'un fichier
SYNOPSIS¶
file [ -bciknsvzL ] [ -f fichier-noms
] [ -m fichiersmagiques ] fichier ...
fichier -C [ -m fichiermagique ]
DESCRIPTION¶
Cette page de manuel documente la version 3.37 de la commande file.
file teste chaque argument pour essayer de le classifier. Il y a trois types de tests, effectués dans cet ordre : tests de système de fichiers, tests de nombre magique, et tests de langage. Le premier test qui réussit provoque l'affichage du type du fichier.
Le type affiché contient en général l'un des mots text (le fichier ne contient que des caractères imprimables et quelques caractères de contrôle courants, et peut probablement être lu sans peine sur un terminal ASCII), executable (le fichier contient le résultat de la compilation d'un programme dans une forme compréhensible par certains noyaux UNIX ou autres), ou data signifiant tout le reste (les données sont en général de type « binary », c.-à-d. binaires, ou « non-printable », c.-à-d. non affichables). Les exceptions sont les formats de fichiers bien connus (fichiers core, archives tar) dont on sait qu'ils contiennent des données binaires. Quand vous modifiez le fichier /usr/share/magic ou le programme lui-même, conservez ces mots-clés. Certains programmes se reposent sur le fait que tous les fichiers accessibles en lecture dans un répertoire doivent être présentés sous le terme « text » (texte) par file. Ne faites pas comme Berkeley (NDT : BSD) qui a remplacé l'expression « shell commands text » (texte de commandes shell) par « shell script » (script shell). Notez que le fichier /usr/share/magic est construit mécaniquement à partir d'un tas de petits fichiers situés dans le sous-répertoire Magdir de la distribution du code source de ce programme.
Les tests de système de fichiers sont basés sur l'examen de la sortie de l'appel système stat(2). Le programme vérifie si le fichier est vide, ou s'il s'agit d'un certain type de fichier spécial. Tous les types de fichiers connus appropriés à votre système (sockets, liens symboliques ou tubes nommés (FIFOs) sur les systèmes qui les implémentent) sont reconnus lorsqu'ils sont définis dans le fichier d'en-tête système <sys/stat.h>.
Les tests de nombres magiques sont utilisés pour rechercher des fichiers contenant des données dans des formats fixes particuliers. L'exemple typique est un exécutable binaire (programme compilé) a.out, dont le format est défini dans a.out.h, et peut-être aussi dans exec.h dans le répertoire d'inclusion standard. Ces fichiers contiennent un « nombre magique » qui indique au système d'exploitation UNIX que le fichier est un exécutable binaire, et qui donne le type précis parmi ces multiples types possibles. Le concept de « nombre magique » a été appliqué par extension aux fichiers de données. Tout fichier contenant un identificateur invariable à un endroit fixé peut d'habitude être décrit de cette façon. Les informations identifiant ces fichiers sont lues à partir du fichier magique compilé /usr/share/magic.mgc, ou /usr/share/magic si le fichier compilé n'existe pas.
Si un fichier ne correspond à aucune des entrées du fichier magique, il est examiné afin de voir s'il semble être un fichier texte. Les jeux de caractères ASCII, ISO-8859-x, et ASCII étendu 8 bits non ISO (comme ceux utilisés sur les systèmes Macintosh et PC IBM), ainsi que les jeux de caractères Unicode encodés en UTF-8 ou en UTF-16, et EBCDIC peuvent être différenciés par l'intermédiaire des différents intervalles et séquences d'octets qui sont imprimables dans chaque jeu. Si un fichier passe avec succès l'un de ces tests, son jeu de caractères est rapporté. Les fichiers ASCII, ISO-8859-x, UTF-8, et ASCII étendu sont identifiés en tant que « text » (texte) car ils sont pour la plupart lisibles sur pratiquement n'importe quel terminal ; UTF-16 et EBCDIC ne sont que des « character data » (données caractères) car, bien qu'elles contiennent du texte, celui-ci requiert une traduction avant de pouvoir être lu. De plus, file essaiera de déterminer d'autres caractéristiques des fichiers de type texte. Si les lignes d'un fichier sont terminées par CR, CRLF, ou NL, au lieu du LF standard sous Unix, cela sera rapporté. Les fichiers qui contiennent des séquences d'échappement ou du overstriking (NDT : ?) seront également identifiés.
Une fois que file a déterminé le jeu de caractères utilisé dans un fichier de type texte, il essaie de déterminer dans quel langage le fichier est écrit. Les tests de langage recherchent des chaînes de caractères particulières (cf. names.h) qui peuvent apparaître n'importe où dans les premiers blocs d'un fichier. Par exemple, le mot-clé .br indique que le fichier est plus que probablement un fichier d'entrée troff(1), de la même façon que le mot-clé struct indique un programme C. Ces tests sont moins fiables que les deux autres types de tests, et sont donc pratiqués en dernier lieu. Les routines de tests de langage testent également quelques types divers (comme les archives tar(1)).
Tout fichier qui ne peut être identifié comme ayant été écrit dans l'un des jeux de caractères listés plus haut sera rapporté comme étant du type « data » (données).
OPTIONS¶
- -b
- Ne pas faire précéder les lignes de sortie par le nom des fichiers (mode bref).
- -c
- Afficher pour vérification la version analysée (« parsée ») d'un fichier magique. Cette option est habituellement utilisée avec -m pour déboguer un nouveau fichier magique avant de l'installer.
- -C
- Écrire un fichier de sortie magic.mgc qui contient une version pré-analysée de file.
- -f fichier-noms
- Lire le nom des fichiers à examiner à partir du fichier fichier-noms (un par ligne) avant la liste des arguments. Il doit y avoir au moins un fichier-noms ou un argument nom de fichier ; pour tester l'entrée standard, utilisez « - » comme argument nom de fichier.
- -i
- Indique à la commande file de produire des chaînes de caractères de type mime plutôt que celles plus traditionnelles facilement lisibles par un humain. Ainsi, il pourra dire « text/plain; charset=us-ascii » (texte brut, jeu de caractère us-acii) au lieu de « ASCII text » (texte ascii). Pour que cette option fonctionne, file modifie la façon dont il traite les fichiers reconnus par la commande elle-même (comme beaucoup de types de fichiers texte, répertoires, etc.), et utilise un fichier « magique » alternatif. (Voyez la section « FICHIERS » plus bas).
- -k
- Ne pas s'arrêter à la première correspondance, continuer.
- -m liste
- Spécifier une liste de fichiers alternative contenant les nombres magiques. Cela peut être un unique fichier, ou une liste de fichiers séparés par des deux-points.
- -n
- Forcer le vidage de stdout après l'examen de chaque fichier. Ce n'est utile que lors de l'examen d'une liste de fichiers. Cette option est destinée à être utilisée par des programmes qui veulent réceptionner le type du fichier à partir d'un tube.
- -v
- Afficher le numéro de version et se terminer.
- -z
- Essayer de regarder à l'intérieur des fichiers compactés.
- -L
- Suivre les liens symboliques, comme l'option du même nom utilisée par ls(1). (sur les systèmes supportant les liens symboliques).
- -s
- Normalement, file n'essaie de lire et de déterminer le type des fichiers présents comme arguments que s'ils sont rapportés par stat(2) en tant que fichiers ordinaires. Ceci évite des problèmes, car la lecture de fichiers spéciaux peut avoir des conséquences bizarres. Spécifier l'option -s indique à file de lire également les fichiers arguments qui sont des fichiers spéciaux en mode bloc ou en mode caractère. C'est utile pour déterminer le type des systèmes de fichiers des données situées dans des partitions de disque brutes, qui sont des fichiers spéciaux en mode bloc. Cette option indique également à file de ne pas accorder d'importance à la taille de fichier indiquée par stat(2) puisque, sur certains systèmes, il indique une taille nulle pour les partitions de disque brutes.
FICHIERS¶
/usr/share/magic.mgc - liste compilée des nombres magiques par défaut.
/usr/share/magic - liste des nombres magiques par défaut.
/usr/share/magic.mime - liste des nombres magiques par défaut, utilisée pour produire des types mime quand l'option -i est spécifiée.
ENVIRONNEMENT¶
La variable d'environnement MAGIC peut être utilisée pour spécifier le nom des fichiers de nombres magiques par défaut.
VOIR AUSSI¶
magic(5) - description du format du fichier magique.
strings(1), od(1), hexdump(1) - outils d'examen de
fichiers non-textes.
CONFORMITɶ
Ce programme est supposé excéder la définition de l'interface System V pour FILE(CMD), pour ce qu'on peut comprendre du langage vague qui y est employé. Son comportement est en grande partie compatible avec le programme System V du même nom. Cette version connaît cependant plus de nombres magiques, et produira donc des sorties différentes (même si plus précises) dans de nombreux cas.
La seule différence significative entre cette version et
celle de System V est que cette version considère n'importe quelle
espace blanche comme un délimiteur, de sorte que les espaces dans les
chaînes de caractères de motifs doivent être
protégées. Par exemple,
>10 string language impress (données imPRESS)
d'un fichier magique existant devrait être changé en
>10 string language\ impress (données imPRESS)
En plus, dans cette version, si une chaîne de caractères de
motif contient un backslash, il doit être protégé. Par
exemple,
0 string \begindata document Andrew Toolkit
d'un fichier magique existant devrait être changé en
0 string \\begindata document Andrew Toolkit
Les versions 3.2 et ultérieures de SunOS de Sun
Microsystems incluent une commande file(1) dérivée de
celle de System V, mais avec quelques extensions. Ma version ne
diffère que peu de celle de Sun. Elle inclut l'extension de
l'opérateur « & » utilisé, par
exemple, dans
>16 long&0x7fffffff >0 not stripped
RÉPERTOIRE MAGIQUE¶
Les entrées du fichier magique ont été rassemblées à partir de sources diverses, principalement via USENET, et ont reçu des contributions de différents auteurs. Christos Zoulas (adresse plus bas) collectera les entrées additionnelles ou corrigées du fichier magique. Une mise à jour des entrées du fichier magique sera distribuée périodiquement.
L'ordre des entrées présentes dans le fichier magique est important. En fonction du système que vous utilisez, l'ordre dans lequel elles sont placées peut être incorrect. Si votre ancienne commande file utilise un fichier magique, gardez quelque part l'ancien fichier magique pour pouvoir effectuer des comparaisons (renommez-le en /usr/share/magic.orig).
EXEMPLES¶
$ file file.c file /dev/hda file.c: C program text file: ELF 32-bit LSB executable, Intel 80386, version 1,
dynamically linked, not stripped /dev/hda: block special $ file -s /dev/hda{,1,2,3,4,5,6,7,8,9,10} /dev/hda: x86 boot sector /dev/hda1: Linux/i386 ext2 filesystem /dev/hda2: x86 boot sector /dev/hda3: x86 boot sector, extended partition table /dev/hda4: Linux/i386 ext2 filesystem /dev/hda5: Linux/i386 swap file /dev/hda6: Linux/i386 swap file /dev/hda7: Linux/i386 swap file /dev/hda8: Linux/i386 swap file /dev/hda9: empty /dev/hda10: empty $ file -i file.c file /dev/hda file.c: text/x-c file: application/x-executable, dynamically linked (uses shared libs), not stripped /dev/hda: application/x-not-regular-file
HISTORIQUE¶
Il y a eu une commande file dans chaque UNIX depuis au moins la version de recherche 6 (page de manuel datée du 16 janvier 1975). La version de System V a introduit un changement majeur : la liste externe des types de nombres magiques. Ceci a considérablement ralenti le programme mais l'a rendu beaucoup plus flexible.
Ce programme, basé sur la version System V, a été écrit par Ian Darwin <ian@darwinsys.com> sans jeter le moindre coup d'oeil à un code tiers.
John Gilmore révisa largement le code, l'améliorant par rapport à la première version. Geoff Collyer trouva plusieurs inadéquations, et fournit quelques entrées du fichier magique. Contributions de l'opérateur « & » par Rob McMahon, cudcv@warwick.ac.uk, 1989.
Guy Harris, guy@netapp.com, a effectué de nombreuses modifications depuis 1993.
Développement et maintenance principaux depuis 1990 par Christos Zoulas (christos@astron.com).
Modifié par Chris Lowth, chris@lowth.com, en 2000 : support de l'option « -i » pour produire des chaînes de types mime, et utilisation d'un fichier magique et d'une logique interne alternatifs.
Modifié par Eric Fischer (enf@pobox.com), en juillet 2000, pour identifier les codes de caractères et essayer d'identifier le langage des fichiers non ASCII.
La liste des contributeurs au répertoire « Magdir » (source pour le fichier /etc/magic) est trop longue pour être incluse ici. Vous vous reconnaîtrez ; merci.
COPYRIGHT¶
Copyright (c) Ian F. Darwin, Toronto, Canada, 1986-1999. Couvert par le copyright BSD standard ; voyez le fichier LEGAL.NOTICE dans la distribution des sources.
Les fichiers tar.h et is_tar.c ont été écrits par John Gilmore à partir de son programme tar du domaine public, et ne sont pas couverts par la licence précitée.
BOGUES¶
Il y a sûrement une meilleure façon d'automatiser la construction du fichier Magique à partir de tout le fouillis contenu dans Magdir. Quelle est-elle ? Il vaudrait mieux compiler le fichier magique en binaire (via, p.ex., ndbm(3) ou, mieux encore, en chaînes de caractères ASCII de longueur fixe pour une utilisation dans des environnements réseaux hétérogènes) pour un démarrage plus rapide. Ensuite, le programme devrait tourner aussi rapidement que la version 7 du programme du même nom, avec la flexibilité de la version System V.
File utilise plusieurs algorithmes qui favorisent la vitesse par rapport à la précision, et il peut ainsi se tromper sur le contenu des fichiers texte.
Le support des fichiers texte (principalement pour les langages de programmation) est simpliste, inefficace, et requiert une recompilation pour une mise à jour.
Il devrait y avoir une clause « else » pour suivre une série de lignes de prolongement.
Le fichier magique et les mots-clés devraient supporter les expressions rationnelles. Son utilisation du TAB ASCII comme un délimiteur de champ est horrible et rend difficile l'édition des fichiers, mais est acté.
Il serait souhaitable d'autoriser les lettres majuscules dans les mots-clés pour différencier, par exemple, les commandes troff(1) des macros des pages de manuel. La prise en charge des expressions rationnelles devrait faciliter cela.
Le programme ne reconnaît pas FORTRAN. Il devrait être capable de le faire en recherchant quelques mots-clés qui apparaissent indentés par rapport au début de la ligne. La prise en charge des expressions rationnelles devrait faciliter cela.
La liste de mots-clés de ascmagic appartient probablement au fichier Magique. Ceci pourrait être fait en utilisant un mot-clé comme « * » pour la valeur de décalage.
Une autre optimisation pourrait être de réordonner le fichier magique afin que l'on puisse effectuer les tests pour le premier octet, le premier mot, etc., une fois qu'on l'a extrait. Prévenir des conflits dans les entrées du fichier magique. Éventuellement créer une règle pour que les entrées soient triées sur base du décalage par rapport au début du fichier plutôt que sur la position à l'intérieur du fichier magique.
Le programme devrait fournir un moyen d'estimer le degré de fiabilité d'une supposition. Nous en arrivons à supprimer des suppositions (p.ex. « From : » comme cinq premiers caractères du fichier) car elles ne sont pas aussi pas aussi bonnes que d'autres (p.ex. « Newsgroups : » vs « Return-Path : »). Néanmoins, si les autres ne fonctionnent pas, il devrait être possible d'utiliser la première supposition.
Ce programme est plus lent que les commandes file de certains vendeurs. La récente prise en charge des codes de caractères multiples augmente encore cet écart.
Cette page de manuel, en particulier cette section, est trop longue.
DISPONIBILITɶ
Vous pouvez obtenir la dernière version de l'auteur original via FTP anonyme sur ftp.astron.com dans le répertoire /pub/file/file-X.YY.tar.gz
TRADUCTION¶
Frédéric Delanoy <delanoy_f at yahoo.com>, 2002.
27 avril 2001 | Linux |